Применение волновой модели текста к задаче сентимент-анализа
Аннотация:
Предмет исследования. Исследована волновая модель представления коротких текстов на русском языке. Модель является одной из реализаций дистрибутивной семантики. В модели учтены не только частоты встречаемости слов в тексте, но и их взаимное влияние. Итогом реализации модели служит повышение точности анализа тональности коротких текстов. Метод. Основу определения взаимосвязей между текстом и термином составляет расчет амплитуды вероятности близости текста к термину с использованием волновой модели. Термин, обладающий наибольшей амплитудой вероятности, считается наиболее точно соответствующим смыслу текста. Волновая модель позволяет учесть тот факт, что известные методы определяют антонимы как семантически близкие лексические единицы. Основные результаты. Для экспериментального исследования предложенного метода выбрано решение задачи сентимент-анализа, то есть нахождения соответствия отзывов пользователей о покупках на маркетплейсе классам «позитивный» и «негативный». В результате эксперимента получена точность оценки тональности текста до 76,4 %, что превышает точность классического подхода, а также известных методик сентимент-анализа для русского языка. Выявлено значительное влияние таких параметров модели, как выбор базисной дистрибутивно-семантической модели, выбор контрольной точки для расчета волновых чисел, учет влияния антонимов на точность классификации. Представленная модель показала высокую точность в выявлении взаимосвязей текста с не присутствующими в нем явно понятиями. Практическая значимость. Предложенный метод может успешно применяться как математическая основа решения задач сентимент-анализа. Полученные результаты показали потенциальные возможности использования волновой модели в областях, требующих классификации текстов по косвенным признакам, например, для определения элементов психологического портрета автора.
Ключевые слова:
Постоянный URL
Статьи в номере
- Импульсная запись динамических голограмм в кристалле силиката висмута при изменении длины волны лазерного излучения
- Гибридный эндоскоп с телевизионной и многоспектральной обработкой изображений для диагностики рака внутренних органов
- Моделирование композитного волноводного голографического дисплея
- Применение методов инфракрасной спектроскопии в исследовании составов для проклейки бумаги
- Методика оптимизации распределения плотности пикселов по зоне наблюдения
- Оценка ошибки и разработка методики компенсации погрешности позиционирования оборудования с числовым программным управлением
- Компенсация внешних возмущений по выходу для класса линейных систем с запаздыванием в канале управления
- Люминесцентный метод исследования роста квантовых точек AgInS2
- Особенности импульсного лазерного напыления тонких пленок InGaAsN в атмосфере активного фонового газа
- Нахождение распределения электронов в сверхрешетках AlGaAs/GaAs
- Спектральные и кинетические свойства квантовых точек сульфида серебра во внешнем электрическом поле
- Влияние наноразмерных горизонтальных неоднородностей на послойный анализ поверхности методом рентгеновской фотоэлектронной спектроскопии
- Органические светоизлучающие диоды с новыми красителями на основе кумарина
- Изготовление и характеристика гибридного композита Al6082/SiC/порошок рисовой шелухи, получаемого методом фрикционного перемешивания
- Многопутевая безопасная маршрутизация для обнаружения атаки с захватом узла в беспроводной сенсорной сети
- Метод документирования архитектурных решений вычислительных платформ
- Повышение точности распознавания внесловарных слов для интегральной системы автоматического распознавания русской речи
- Метод мониторинга состояния элементов киберфизических систем на основе анализа временных рядов
- Автоматизированная оценка параметров электрокардиограмм в условиях пандемии COVID-19
- Мультиагентная адаптивная маршрутизация агентами-клонами на основе многоголового внутреннего внимания с использованием обучения с подкреплением
- Совместное обучение агентов и векторных представлений графов в задаче управления конвейерными лентами
- Моделирование процессов переноса излучения в газожидкостных пенах
- Статистическая оценка влияния величины сигнал/помеха на погрешность измерения параметров акустической эмиссии
- Моделирование процесса стационарного термоотражения для измерения теплопроводности материалов
- Математическое и компьютерное моделирование однорядных и двухрядных шестилопастных винтокольцевых движителей
- Дифференциально-разностная модель теплопереноса в твердых телах с использованием метода параметрической идентификации